E 

o 

» Schneck 
I M. Schneck 
Gina McCarthy 
Nissa Strottman 



Law Offices of 

SCHNECK & SCHNECK 

P.O. BOX 2-E 
SAN JOSE, CALIFORNIA 95109-0005 

80 S. Market Street 
Third Floor 
San Jose, California 951 13-2303 

Email: mail@patentvalley.com 



Patents and Trademarks 

August 25, 2003 



Telephone: (408) 297-9733 
Facsimile: (408) 297-9748 



Commissioner for Patents 
P.O. Box 1450 

Alexandria, Virginia 22313-1450 



Re: Certified Copy of Priority Document 
U.S. Serial No.: 10/615,475 
Filed: July 7, 2003 

For: EFFICIENT MULTIPLICATION SEQUENCE 
FOR LARGE INTEGER OPERANDS WIDER 
THAN THE MULTIPLIER HARDWARE 

Our ref: ATM-214 (V. Dupaquis et al . ) 

Dear Sir: 



Transmitted herewith for the above- identified patent 
application is a certified copy of the priority document, French 
application no. 03/04299 filed April 7, 2003. 



Respectfully submitted, 



CERTIFICATE OF MAILING 

I hereby certify that this paper (along with any 
paper referred to as being attached or enclosed) is 
being deposited with the United States Postal 
Service on the date shown below with sufficient 
postage as first class mail in an envelope addressed 
to: Commissioner for Patents, P.O. Box 1450, 
Alexandria, Virginia 22313-1450. 

Si ^ : 1Mj±L IP M*aa^ 

Typed Name: Merle P. Garcia 

Date : August 25, 2003 




Thomas Schneck 
Reg. No. 24,518 

Schneck & Schneck 
P.O. Box 2-E 
San Jose, CA 95109-0005 
(408) 297-9733 



Encl: Certified copy of priority document 
cc: J. McGuire, Esq. w/encl . 



REPUBLIQUE FRANCHISE 




INSTITUT 
NATIONAL DE 
LA PROPRIETE 
INDU8TRIELLE 



BREVET D' INVENTION 



CERTIFICAT D'UTILITE - CERTIFICAT D'ADDITION 



COPIE OFFICIELLE 



Le Directeur general de I'lnstitut national de la propriete 
industrielle certifie que le document ci-annexe est la copie 
certifiee conforme d'une demande de titre de propriete 
industrielle deposee a I'lnstitut. 



Fait a Paris, le 



2.7 JUIM 2003 



Pour le Directeur general de I'lnstitut 
national de la propriete industrielle 
Le Chef du Departement des brevets 





Marline PLANCHE 



INSTITUT 
NATIONAL DE 
LA PROPRIETE 
INDUSTRIELLE 



SIEGE 

26 bis, rue de Saint Petersbourg 
75800 PARIS cedex 08 
Telephone : 33 (0)1 53 04 53 04 
Telecopie : 33 (0)1 53 04 45 23 
www.inpi.fr 



DB 267/141102 



ETABLISSEMENT PUBLIC NATIONAL CREE f»AR LA LOl N« 31-444 DU 19 AVRIL 1951 




■ msmuT 

MATIOIIAl D« 

i* norsirn 
DtogsTHict.il 



26 bis, rue de Saint Petersbourg 
75800 Paris Cedex 08 

Telephone : 33 (1) 53 04 53 04 Telecopie : 33 (1) 42 94 86 54 



REMISE DES PIECES 



iR&jervSariNPlr 



BREVET D'INVENTION 
CERTIFICAT D UTILITE 

Code de la propriete intellectuelle - Livre VI 

REQUETE EN DELIVRANCE 
page 1/2 

Cet imprime est & remplir lisiblement a I'encre noire 



N» 11354'02 



BR1 



08 540 @ W f 010801 



DATE 
LIEU 



7 AVRIL 2003 

75 INP1 PARIS 

N° D'ENREGISTREMENT 0304299 
NATIONAL ATTRtBUE PAR L'lNPl 

DATE DE DEPOT ATTRIBUTE 
PAR LWI 



0 7 AVR. 2003 



Vos references pour ce dossier 

(facultatij) 33312/FR 



| NOM ET ADRESSE OU DEMANDEUR OU OU MANDATAIRE 
A QUI LA CORRES PON DANCE DOIT ETRE ADRESSEE 



BREESE-MAJEROWICZ 
3 avenue de 1'Opera 
75001 PARIS 



Confirmation d'un depot par telecopie 


n N° attribue par riNPI a ia telecopie 


Q NATURE DE L 


.A' DEMANDE ^ " ' * 


Cochez Tune des 4 cases suivantes ; . , _ } J , - ; ■ . 


Demande de brevet 


m 


Demande de certificat d'utilite 


□ 


Demande divisionnaire 

Demande de brevet initiate 
ou demande de certificat d'utilite initiate 


□ 

N° Date 1 1 I 1 1 1 1 I 1 

N° Date 1 1 1 1 1 1 1 1 1 - 


Transformation d'une demande de 
brevet euro peen Demande de brevet initiate 


N° Date 1 i 1 1 1 I l i 1 


Q TITRE DE L* INVENTION (200 caracteres ou espaces maximum) 


SEQUENCE DE MULTIPLICATION EFFICACE POUR OP1SRANDES A GRANDS NOMBRES ENTIERS PLUS 
LARGES QUE LE MATERIEL MULTIPLICATEUR 


□ DECLARATION DE PR10RITE 
OU REQUETE DU BENEFICE DE 
LA DATE DE DEPOT D'UNE 
DEMANDE ANTER1EURE FRANQAISE 


Pays ou organisation 

Datel i 1 i I i i i 1 N° 
Pays ou organisation 

Date 1 i I i 1 i i j 1 N° 
Pays ou organisation 

Datej ( | | | | | | | N° 

1 1 S'il y a d'autres priorrtes, cochez la case et utilisez rim prime «Suite» 


H DEMANDEUR (Cochez rune des 2 cases) 


S Personne morale . □ Personne physique . /, , 

*v; - , ■ 


Norn 

ou denomination sociale 


Atmel Corporation 


Prenoms 




Forme juridique 


constitute selon les lois de l'Etat du Delaware 


N° SIREN 


1 t i i i ( t { t 1 


Code APE-NAF 


I i i i l 


Domicile 
ou 

siege 


Rue 


2325 Orchard Parkway 


Code postal et ville 


) SAN JOSE California 95131 


Pays 


U.S.A. 


Nationality 


U.S.A. 


N° de telephone (facultatij) 


N° de telecopie (facultatij) 


Adresse electronique (facultatij) 






1 ) S'il y a plus d'un demandeur, coch z la case t utilis z t'imprime «Suite» 



Remplir imperativement )a 2 to page 



IN 5 ! 



INDUfttKlClLt 



BREVET D" INVENTION 
CERTIFICAT D'UTILITE 

REQUETE EN DELIVRANCE 

page 2/2 



BR2 



R6serv6 & IWI} 



REMISE DES PIECES 

^ 7 AVRIL 2003 
75 IN PI PARIS 

N° D'ENREGISTREMENT 
NATIONAL ATTRIBUE PAR I'INPI 



0304299 



DB 540 @ W / 010801 



V s references pour ce dossier : 

(facultatij) 


33312/FR 


Q MAN DATA! RE 


.(s'llyalieu) : 










' Nom 


BREESE 


Prenom 


Pierre 


Cabinet ou Societe 


BREESE-MAJEROWICZ 


N °de pouvoir permanent et/ou 
de lien contractuel 




Adresse 


Rue 


3 avenue de I'Opera 


Code postal et ville 


17 |5 iO |0 il | Paris 




Pays 


France 


N° de telephone (facultatij) 


01 47 03 67 77 


N° de telecopie (facultatij) 


01 47 03 67 78 | 


\ Adresse electronique (facultatij) 


office@breese.fr 


fa INVENTEUR(S) 






Les inventeurs sont necessairement des personnes physiques - 


Les demandeurs et les inventeurs 
sont les memes personnes 


□ Oui 

1x1 Non : Dans ce cas remplir le formulaire de Designation d'inventeur(s) 


□ RAPPORT DE 


: RECHERCHE 




mm'- 


Uniquement pour une demande de breve 


t (y compris division et transformati n) 


Etablissement immediat 
ou etablissement differe 


m 

n 


Paiement echelonne de la redevance 

(en deuxversements) 


Uniquement pour les personnes physiques effectuant elles-memes leur propre d 'pot 

□ Oui 

□ Non 


D REDUCTION DU TAUX 
DES REDEVANCES 






Uniquement pour les personnes physiques 

| | Requise pour la premiere fois pour cette invention (joindre un avis de non-imposition) 
1 1 Obtenue anterieurement a ce depot pour cette invention (joindre une copie de la 
decision d'admission a ^assistance gratuite ou indiquer sa reference) : AG 1 — 1 — ! — i — 1 — 1 












Si vous avez utilise I'imprime «Suite» f 
indiquez le nombre de pages jointes 




03 SIGNATURE^ D^EMANDEUR 
OU DU MANDA^A!RE\ 
(N m etqualir du si gnat air ) 

BREESE' Pierre j 






VISA DE LA PREFECTURE 
OU DE L'INPI 

fhn 


921038' 













La loi n°78-17 du 6 janvier 1978 relative a 1'informatique, aux fichiers et aux libertes s'applique aux reponses faites a ce formulaire. 
Elle garantit un droit d'acces et de rectification pour les donnees vous concernant aupres de I'lNPI. 



ler aepot 



1 

SEQUENCE DE MULTIPLICATION EFFICACE POUR OPERANDES A 
GRANDS NOMBRES ENTIERS PLUS LARGES QUE LE MATERIEL 

MULTI PLICATEUR 

La presente invention concerne des circuits de 
traitement arithmetique, specif iquement un materiel 
multiplicateur, et les procedes d 1 utilisation de celui-ci 
pour executer des operations de multiplication ou de 
multiplication-accumulation (et les operations associees 
d' elevation au carre) impliquant au moins un operande de 
plusieurs mots qui est plus large que le materiel 
multiplicateur . 

L' invention concerne en particulier la commande 
materielle de la sequence de multiplication pour executer 
de telles operations a plusieurs mots d'une maniere 
efficace, ou le precede est caracterise par l'ordre 
particulier dans lequel sont traites les mots des 
operandes . 

Le materiel de multiplication a necessairement une 
taille finie, typiquement definie comme ayant une paire 
d 1 entree d' operandes a mot unique et une sortie resultats 
en deux mots. Afin d'executer des operations de 
multiplication-accumulation, la sortie du multiplicateur 
est normalement reliee a un circuit accumulateur , qui a 
au moins une largeur de deux mots plus un bit. (Le bit 
supplementaire peut faire partie du resultat ou 
simplement etre present en tant qu 1 information de REPORT 
indiquant soit un depassement par valeurs superieures 
dans le cas d'une addition ou d'un depassement par 
valeurs inferieures dans le cas de soustraction dans la 
partie accumulation de 1 ' operation . ) L T operation de base 
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est done R = Z ± XY. Pour une multiplication simple, R = 
XY, l 1 entree accumulateur Z = 0. Pour les operations 
d'elevation au carre, X = Y . L ? operation de base est 
habi tuellement congue pour executer une arithmetique 
5 d f entiers standard, mais le materiel de multiplication 
qui execute 1 1 arithmetique polynomiale existe egalement, 
notamment pour utiliser les applications 
cryptographiques . 

En cryptographie et dans un certain nombre d'autres 

10 applications, on a besoin de multiplier de tres gros 
nombres entiers comprenant un grand nombre de mots. Pour 
effectuer ces operations a I'aide d'operandes qui sont 
beaucoup plus larges que le materiel de multiplication, 
les operandes doivent etre decoupes en une pluralite de 

15 segments a mot unique et introduits dans le materiel dans 
une certaine sequence specifiee. Ces segments font 
l'objet d 1 operations et les resultats intermediaires sont 
accumules de sorte que le produit final est calcule comme 
la somme de produits croises de poids divers. Les 

20 segments d 1 operande ayant la largeur d'un mot, ainsi que 
les resultats partiels, sont enregistres dans une memoire 
qui est adressee par le sequenceur d 1 operations du 
materiel multiplicateur . 

Une sequence type conserve un segment d'operandes 

25 constant tandis que d'autres segments d'operande sont 
analyses mot par mot pour etre introduits dans le 
multiplicateur ; ensuite le premier operande incremente 
au segment large d'un mot suivant et 1 T analyse du 
deuxieme operande est repetee. Si X = £i XiW 1 , Y = Yj wj r 

30 et Z = ^ k x k w k , avec w = 2 n , alors 

R = E k r k vj* = Z ± XY - S k ± ZiSj (x iyj )w i+j , 
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ou i+j = k, et ou n est la taille du mot en bits. Ainsi, 
dans une sequence d 1 operations typique, les mots yj sont 
passes sur tous les j pour un mot fixe xi, puis i est 
increments d'une unite et le cycle de mots yi est repete 
pour le nouveau x A . 

Tandis que la nouvelle sequence decrite ci-dessus 
est directe, facile a programmer et donne le resultat 
correct, chaque etape ou cycle necessite une moyenne de 
trois acces de la memoire a acces direct. En particulier, 
chaque etape necessite que yj et z k soient extraits de la 
memoire, et qu 1 un resultat partiel r* soit reecrit en 
memoire . 

Un objet de 1' invention est de proposer une sequence 
de multiplication a plusieurs mots efficace pour les 
operations a grands entiers, qui necessite en moyenne un 
seul acces memoire par multiplication. 

L'objet est realise par un procede qui traite la 
sequence de multiplication en groupes de deux poids-mot 
de resultat (appeles colonnes) . Dans un groupe de paires 
de colonnes, la sequence procede par colonnes alternantes 
avec des poids de segment d ? operande augmentant 
constamment (ou diminuant constamment) (qualifies de 
rnodele en zigzag), de sorte que l'un des segments 
provenant d'un cycle de multiplication precedent est 
aussi utilise dans le present cycle de multiplication, 
et, sauf event uellement pour le premier cycle de 
multiplication dans un groupe donne, seul un des segments 
d 1 operande doit etre extrait de la memoire dans un cycle 
de multiplication quelconque pour ce groupe. Des 
additions de produits partiels de memes poids de 
resultats sont executees dans une operation accumulee qui 
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est transmise avec 1' operation de multiplication, Des 
segments de deux mots d 1 un parametre accumule separe 
peuvent aussi etre ajoutes au debut ou a la fin d'une 
sequence d 1 operations accumulees du groupe correspondant. 

Un module de multiplication accumulation (MAC) 
execute les cycles de multiplication et d r accumulation 
comme ordonne par un sequenceur d'operations 
preprogrammee dans le logiciel interne dans le materiel 
de multiplication, avec lectures des segments d'operande 
depuis la memoire a acces direct (RAM) transferees au 
module MAC par le biais de registres internes au materiel 
de multiplication. De meme, les ecritures des resultats 
intermediaires et finaux sont ramenes dans le registre 
interne pour segments de parametres accumules et 
finalernent retournes dans la RAM. 

Une autre amelioration ajoute des registres de 
memoire cache internes pour contenir les segments de 
parametres frequemment utilises qui reviennent au debut 
ou a la fin de chaque groupe de cycle de multiplication. 

L' invention a un avantage sur les sequences de 
multiplication precedentes en ce qu'elle adapte largement 
les exigences des mult iplicateurs pour les segments de 
parametre a la largeur de bande d' acces memoire d'une 
lecture et d 1 une ecriture par cycle de multiplication, de 
sorte qu'une multiplication globale de grands entiers de 
plusieurs mots est executee efficacement en un minimum de 
cycles. L 1 operation de multiplication peut aussi etre 
etendue sur plusieurs cycles (en utilisant le traitement 
"pipeline"), auquel cas on considere encore que, en 
moyenne, une multiplication est executee par cycle, 
puisqu'un resultat de multiplication est disponible par 
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cycle et puisqu'une nouvelle operation de multiplication 
peut etre lancee par cycle. 

Ainsi, 1' invention concerne un procede de fonctionnement 
d'un circuit de multiplication pour calculer le produit 
de deux operandes (X et Y) dont au moins un d'eaux est 
sensiblement plus large que le circuit de multiplication, 
le circuit de multiplication ayant une paire d 1 entrees 
d' operandes d'une largeur de deux mots et une sortie 
resultat d'une largeur de deux mots, ou un mot est un 
nombre specifie de bits, chacun des operandes compose 
d'une pluralite de segments d'operande contigus d'une 
largeur -de mot ordonnee (x k et y m ) , caracterises par des 
poids specifiques (k et m) , le circuit de multiplication 
ayant acces a une memoire, le procede comprenant les. 
etapes consistant a : 

charger des segments d' operandes d'une largeur d'un 
mot des deux operandes dans un ordre specifie a partir de 
la memoire dans le circuit de multiplication, le circuit 
de multiplication comprenant au moins deux registres (RX 
et RY) ayant acces a ladite memoire pour contenir 
temporairement les segments charges ; 

multiplier les segments charges pour obtenir des 
produits intermediaires d'une largeur de deux mots, les 
produits intermediaires ayant un poids egal a la somme 
des poids des segments charges ; 

ajouter des produits intermediaires du meme poids 
dans un accumulateur , 1 1 accumulateur ayant une taille de 
trois mots plus un nombre de bits de report, suffisante 
pour gerer une taille d'operande maximale specif iee, 
1 ' accumulateur connecte a un registre d 1 entree de deux 
mots (RZ) pour contenir temporairement tout produit d'un 
poids specifique ajoute precedemment et un registre de 



sortie a deux mots (RR) pour contenir les resultats d'une 
etape d T addition, lesdits registres (RZ et RR) ayant 
acces a ladite memoire ; et 

enregistrer les resultats accumules depuis ledit 
5 registre de sortie (RR) de nouveau dans ladite memoire au 
moins apres accumulation de tous les produits 
intermediaires du poids specifie ; 

dans lequel 1 1 ordre specifie pour les segments d'operande 
de chargement dans lesdits registres est une sequence 

10 definie par les poids des produits intermediaires 
resultants, dans lequel l'etape de multiplication est 
faite par groupes successifs de deux poids de produits 
adjacents, avec la sequence a l 1 interieur d'un groupe 
selectionnee de sorte que, a I 1 exception d'une premiere 

15 operation de multiplication dans un groupe donne, au plus 
un des segments d'operande doive etre lu de la memoire et 
place dans un registre (RX ou RY) , 1' autre segment 
d'operande etant deja enregistre dans 1' autre registre 
(RY ou RX) a partir de 1' operation de multiplication 

20 immediatement precedente. 

Avantageusement , le registre d 1 entree de 1 ' accumulateur 
(RZ) sera charge avec un segment d 1 un mot accumule (Z), 
ou le segment est du meme poids ' que les produits 
intermediaires a former dans ladite etape de 

25 multiplication, moyennant quoi le procede de 
fonctionnement execute une operation de multiplication- 
accumulation sur une paire d'operandes de multiplication 
et un operande d 1 accumulation. 

De preference, la sequence se deroulera a 1' interieur 
30 d'un groupe dans un modele en zigzag de poids de segments 
d'operande augmentant constamment. 
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Avantageusement, la sequence se deroulera a l'interieur 
d'un groupe dans un modele en zigzag de poids de segments 
d'operande diminuant constamment . 

De preference, le circuit de multiplication contiendra en 
outre un ensemble de registre de memoire cache interne, 
lesdits registres de memoire cache etant charges depuis 
la memoire avec des segments d'operande qui sont 
frequemment utilises dans une operation de 
multiplication . 

Avantageusement , la sequence se deroulera a l'interieur 
d'un groupe commengant par une operation de 
multiplication avec au moins un segment d'operande 
enregistre dans un registre de memoire cache dans une 
premiere direction en zigzag de poids de segments 
d'operande augmentant ou diminuant constamment, puis 
passe directement a une operation de multiplication du 
groupe pas encore executee qui a aussi au moins un 
segment d'operande enregistre dans un registre de memoire 
cache et continue dans une deuxieme direction en zigzag 
de poids de segments d'operande diminuant ou augmentant 
constamment jusqu'a ce que toutes les operations de 
multiplication pour ce groupe soient terminees. 
De preference, l'ordre specif ie sera preprogramme dans le 
logiciel interne dans un sequenceur d' operations du 
circuit de multiplication, avec des longueurs de mot 
d'operande incluses en tant que parametre d' entree pour 
une commande de multiplication. 

1/ invention se rapporte egalement a un circuit de 
multiplication, comprenant : 

un module de multiplication-accumulation (MAC) 
comprenant un ensemble mult iplicateur qui introduit des 
segments d'operandes recepteur a mot unique a multiplier 
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pour former un produit intermediaire de deux mots, et 
comprenant aussi un circuit accumulateur avec une 
premiere entree de deux mots pour recevoir des produits 
intermediaires provenant du multiplicateur , une deuxieme 
entree de deux mots pour recevoir une valeur accumulee, 
et une sortie de trois mots plus un certain nombre de 
bits de report suffisant pour gerer une taille d'operande 
maximum specifiee pour proposer une somme de valeurs 
d f entree provenant des entrees de deux mots, la sortie de 
1 1 accumulateur retournant aussi deux mots a la deuxieme 
entree de deux mots ; 

un ensemble de registres d'adresses internes pour 
adresser une memoire a acces direct ; 

. un ensemble de registres de donnees internes (RX, 
RY, RZ, RR) connectes pour recevoir et transmettre des 
segments desdites operandes depuis et a destination de 
ladite memoire et aussi connectes audit ensemble 
multiplicateur et audit accumulateur de maniere a fournir 
des segments d'operande aux entrees de ceux-ci et a en 
recevoir des resultats, chacun desdits segments 
d'operande ayant un poids specif ie ; et 

un sequenceur d' operations pour controler l f acces a 
la memoire par lesdits adresse interne et registres de 
donnees et controler la sequence d' operations de 
multiplication et d 1 accumulation par lesdits ensemble 
multiplicateur et accumulateur respectifs, 

dans lequel ladite sequence est definie par les poids des 
produits resultants egaux a la somme des poids des 
segments d'operande en cours de multiplication, dans 
lequel les operations de multiplication sont faites dans 
des groupes successifs de deux poids de produits 
adjacents, avec la sequence dans un groupe selectionne de 
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sorte que, excepte une premiere operation de 
multiplication dans un groupe donne, au maximum un des 
segments d 1 operande doive etre lu de la memoire dans un 
registre (RX ou RY) , l'autre segment d'operande etant 
deja enregistre dans l'autre registre (RY ou RX) depuis 
1 ? operation de multiplication immediatement precedente. 

Un mode d' execution de 1' invention sera decrit ci- 
apres, a titre d'exemple non limitatif, avec reference 
aux figures annexees dans lesquelles : 

La Figure 1 est une vue en projection horizontale 
schematique de 1 1 architecture principale d 1 un systeme de 
traitement qui comprend un moteur de multiplication de la 
presente invention . 

La Figure 2 est un diagramme d 1 interface 
representant les registres et I 1 interface memoire pour un 
moteur de multiplication typique selon la presente 
invention . 

La figure 3 est une vue en projection horizontale 
schematique detaillee d ? un module MAC dans le moteur de 
multiplication de la figure 1. 

La figure 4 est un tableau de plusieurs 
multiplications et additions mot par mot etablie par 
operande et par poids de resultat servant a illustrer la 
sequence d' operation selon la presente invention. 

Les figures 5a, 5b et 5c sont un tableau montrant 
une sequence d' operations pour un mode de realisation de 
multiplication de la presente invention, utilisant un 
ensemble additionnel de 5 registres de memoire cache 
stockant des segments d' operande frequemment utilises. 

La figure 6 est un tableau de plusieurs 
multiplications et additions mot par mot disposees comme 
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sur la figure 4 par operande et par poids de resultat 
pour une operation de multiplication-accumulation 
"rectangulaire" exemplaire avec des operandes de 
dif f erentes tail les . 

Les figures 7a, 7b et 7c sont un tableau montrant un 
autre exemple d'une sequence d' operation correspondant 
aux exemples de la figure 6, dans ce cas avec un ensemble 
de 7 registres de memoire cache dans le materiel. 

Avec reference a la figure 1, 1 1 architecture 
principale d'un systeme de traitement est vu pour inclure 
un processeur central principal 11 et un moteur 
multiplicat eur 13 partageant une memoire a acces direct 
ou RAM 15 et une memoire cache a registres de commande de 
multiplicateur 17. Le moteur mult iplicateur 13 comprend 
un module de multiplication accumulation (MAC) 21, un 
sequenceur d ? operations 23 connecte pour envoyer des 
signaux de commande au MAC 21, des registres de commande 
25 et des registres de donnees internes 27. 

Des modules de gestion de memoire/protection de 
memoire (MMU/MPU) 14 et 19 assurent l 1 interface de la RAM 
15 et de la memoire cache 17 avec le processeur 11 et le 
moteur multiplicateur 13. Dans notre configuration 
preferee, il y a un MMU/MPU pour le processeur central 11 
concernant a la fois les acces a la RAM et aux 
peripher iques (afin de controler/limiter les acces a 
certaines z one s /pe r ipher i ques ) . Ici, le moteur 
multiplicateur 13 est considere comme un per ipherique . 
Comme le moteur multiplicateur a un acces direct a la RAM 
15, il pourrait etre un moyen pour 1 r ut ilisateur de 
surmonter les limitations d'acces specifiees dans le 
MMU/MPU cote noyau 19. Par consequent, nous proposons un 
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autre MMU/MPU 14 pour controler les acces a la memoire 
par le moteur mult iplicateur 13. Les deux modules MMU/MPU 
14 et 19 doivent etre configures de maniere coherente, 
mais il n'y a aucun lien entre eux et leur f onctionnement 
est independant. 

Le moteur mult iplicateur 13 n f a generalement pas de 
ROM dediee, mais il est configure et parametre par le 
processeur central 11. Les registres de commande 25 sont 
connectes a la memoire cache des registres de commande 17 
desquels ils regoivent des instructions provenant du 
processeur central 11. Les registres de commande 25 
transmettent les parametres d T instruction et des 
informations d'etat au sequenceur d'operations 23, et 
communiquent aussi avec le module MAC 21, par exemple 
pour selectionner le mode MAC (arithmetique standard ou 
arithmetique polynomiale) pour ces modules MAC qui 
peuvent etre capables des deux types d 1 arithmetique, pour 
selectionner une operation MAC a mot unique ou a mots 
multiples, et pour communiquer n'importe quelle valeur de 
report depuis une operation MAC en cours ou precedente. 

Les registres d'adresses ou de donnees internes 27 
sont reliees a la RAM partagee 15 pour recevoir et 
emettre des parametres d'operande d'une operation MAC. Le 
sequenceur d' operation 23 est de preference preprogrammed 
par logiciel interne (firmware) selon 1' invention decrite 
ici. Le sequenceur d'operations 23 envoie des 
instructions et des adresses aux registres internes 27 et 
de la a la RAM partagee 15 pour diriger le chargement de 
segments d'operandes d'une largeur d'un mot dans un ordre 
specifie selon la presente invention. L ' architecture est 
typiquement construite de sorte que, lorsque le moteur 
multiplicateur 13 fonctionne, il a un acces privilegie a 
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une partie specif ique de la RAM partagee 15. Cela permet 
au processeur central 11 d f acceder encore a d'autres 
parties de la RAM 15 pendant un calcul. En variante, 
l'acces a la RAM partagee 15 pourrait etre entierement 
dedie au moteur multiplicateur 13 pendant un calcul et 
accessible au processeur central 11 uniquement lorsque le 
multiplicateur 13 ne l'utilise pas, 

Le module MAC 21 peut etre base sur une taille de 
mot de 32 bits. Dans ce cas, les longueurs d'operande 
sont toujours des multiples de 4 octets et les operandes 
sont alignes sur des limites de mot de 32 bits avec des 
zeros d'en-tete si necessaire. Ce choix facilite les 
calculs d'adresses pour la RAM partagee 15 puisque le 
processeur 11 travaille typiquement sur des adresses en 
octets. Le module MAC 21 aurait une paire d'entrees 
d' operandes X et Y (de largeur de mot) de 32 bits pour 
l f ensemble multiplicateur, une entree d 1 accumulateur Z 
d'une largeur de deux mots, une sortie de resultats de 
multiplicateur d'une largeur de deux mots qui forme une 
seconde entree d 1 accumulateur , et une sortie 
d 1 accumulateur R d'une largeur de deux mots. 

Bien que le module MAC 21 ne fonctionne que sur des 
entrees X et Y d'une largeur d 1 un mot, le moteur 
multiplicateur 13 general, y compris le sequenceur 
d ! operations programmees 23, peut etre considere comme un 
multiplicateur de grands entiers (de plusieurs mots) . II 
prend en charge les operations de multiplication 
efficaces telles que multiplication-accumulation de 
nombres a N mots, elevation au carre-accumulat ion de 
nombres de N mots (entree multiplication Y = X) , 
multiplication ou elevation au carre de nombres a N mots 
sans accumulation (entree accumulateur Z = 0), 
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multiplication-accumulation d'un nombre de N mots par une 
constante A de 1 mot (et meme d'l octet). 

Avec reference a la figure 2, 1 ' interaction entre le 
moteur multiplicateur 13 avec ses divers registres et 
memoires cache et avec la RAM partagee 15 est illustree 
par un diagramme d' interface. La RAM 15 enregistre les 
parametres X, Y, Z et R a des blocs d'adresse specif iques 
qu'il faut pointer pour y acceder. Les mots des operandes 
sont toujours enregistres bit de moindre poids en premier 
dans la RAM, a commencer par une adresse de base. Pour 
demander un parametre, ou un mot de segment d'operande 
specif ique, le registre d'adresse correspondant X ADDR, Y 
ADDR, Z ADDR ou R ADDR (certains des registres internes 
27 sur la figure 1) doit etre charge avec 1' adresse 
associee. Les mots adresses sont ensuite charges vers et 
depuis le registre de donnees correspondant RX, RY, RZ et 
RR (plus des registres internes 27 sur la figure 1 
utilises par le module MAC 21) . 

Les registres 25 incluent typiquement un ou 
plusieurs registres d'operations pour specifier une 
operation desiree a executer (multiplication, 
multiplication-accumulation, mult iplicat ion- soustr act ion, 
multiplication par une constante d'un seul mot, elevation 
au carre, etc.), un ou plusieurs registres specifiant 
diverses options (mode naturel ou polynomial, operation 
entiere ou tronquee, report ou entree de report, etc.) 
ainsi qu 1 indications des longueurs d'operande, et un ou 
plusieurs registres indiquant diverses conditions 
(occupe/inactif , un resultat de depassement par valeurs 
superieures/depassement par valeurs inferieures/ zero, 
conditions d'erreur, etc.). 
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Avec reference a la figure 3, le module MAC 21 de la 
figure 1 est constitue d'un ensemble mul t iplicateur de 
nombres entiers 31 recevant des operandes a mot unique ou 
plus generalement des segments de mot a mot unique 
d f operandes plus grandes de plusieurs mots via des 
registres de donnees RX et RY charges de la RAM partagee. 
L * ensemble multiplicateur 31 envoie un resultat a deux 
mots multipliant les mots d f entree vers un accumulateur 
33. L f accumulateur a une taille de trois mots (= 96 bits) 
plus un certain nombre de bits de report suffisant pour 
gerer une taille d'operande maximum specif iee. Par 
exemple, pour les operandes de 512 mots, la colonne la 
plus longue a 512 lignes de produits intermediaires a 
ajouter, necessitant ainsi un espace de 9 bits pour la 
somme de report. Cela donne une largeur d 1 accumulateur 
totale de 105 bits pour cet exemple. L 1 accumulateur 33 
regoit aussi un parametre d 1 entree a deux mots provenant 
du registre de donnees RZ, et envoie un resultat a un 
registre de donnees de resultat RR. Un retour a deux mots 
peut etre propose depuis la sortie de 1 ' accumulateur ou 
du registre de donnees RR a destination du registre 
d T operandes d 1 accumulation pour permettre au segment 
d' operande accumule d'etre mis a jour avant que le 
resultat final dans le registre RR ne soit ecrit de 
nouveau dans la RAM. Une taille typique pour le module de 
multiplication accumulation (MAC) gere des mots de 32 
bits, avec des entrees d'operande de 32 bits provenant 
des registres RX et RY a destination de 1' ensemble 
multiplicateur, et avec une sortie d T ensemble 
multiplicateur d 1 operandes de 64 bits, et des entrees et 
sorties d 1 accumulateur vers et depuis des registres RZ et 
RR. 
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Soit A representant un operande d'un seul mot ou un 
segment d' operande X de plusieurs mots qui est charge 
dans 1 ? ensemble multiplicateur 31 depuis le registre de 
donnees RX, et B representant un segment d'un seul mot 
5 d'un operande de plusieurs mots Y qui est charge dans 
1 T ensemble multiplicateur 31 depuis le registre de 
donnees RY, puis A = £i a i 2 i , B = £j bj2 j , ou a± et b 3 sont 
les bits individuels de l 1 operande ou du segment, et ou i 
et j sont compris entre 0. et 31. 
10 Pour une multiplication sur le champ d'entier z p , 

AB = EiSj aibj2 i+j . 
Pour une multiplication au-dessus du champ de Galois 
GF(2 n ), 1' addition de deux bits est reduite modulo 2 de 
sorte que 

15 AB = S k ,o 2n " 2 (2 k -Si.j=k (arbjmod 2)) 

II peut aussi y avoir un terme "report dans" W qui est 
ajoute. Le traitement du report depend des options 
indiquees par les registres 25 mentionnes ci-dessus . 

20 Notez aussi que le terme "report dans" W ne doit pas 
necessairement avoir un rapport direct au terme de report 
sortant provenant d T un calcul immediatement anterieur. 
Finalement, 1' operation du champ de Galois a une 
influence sur le traitement du report en ce que l'ajout 

25 du terme "report dans" W vers le bit de moindre poids est 
aussi conduit modulo 2. 

Une multiplication grandeur nature d'operandes de 
plusieurs mots X et Y implique une sequence des 
multiplications de mots uniques qui viennent d'etre 

30 decrites. X et Y sont respectivement des nombres de N 
mots et de M mots. L'operation generale est 
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R = fZ] ± {{X-Y) + W) . Ceci peut etre ecrit sous forme de 
somme de produits cornme : 

R= [Lk.o^-'Zkb^ ± (E i .o I, " 1 (S i .o"" 1 (X 1 Y 1 b 1 * j )) + W) . 

5 Cette formule est valide a la fois pour les operations Z p 
et GF(2 n ), et b = 2 32 . L 1 accumulateur de reports de trois 
mots et plus peut calculer Acc := Acc ±(Xi*Yj) ou Acc := 
Acc ± (Xi * Yj • 2 32 ) , si necessaire. L ? invention reside dans 
l T ordre particulier dans lequel les multiplications a un 
10 seul mot se deroulent. 

Sequence d* operations 

En reference a la figure 4, le tableau montre une 
disposition d f operations de multiplication mot par mot 

15 des premiers segments d'operande B0-B7 de l f operande a 
plusieurs mots Y. A titre d ' illustration, les deux 
operandes X et Y ont une largeur de B mots, mais ce ne 
doit pas necessairement etre le cas, Pour obtenir les 
mots de resultat R0 ... R15, il faudra eventuellement 

20 ajouter les divers produits partiels vert icalement 
ensemble avec les mots d r accumulation corr espondant s 
CO ... C15 de l'operande Z. Dans l'ordre des acces a la 
memoire, le chargement des segments d' operandes, leur 
multiplication respective, et l T ajout aux segments 

25 d 1 accumulation, sont organises en doubles colonnes de 
poids de resultat adjacents. Chaque groupe de deux 
colonnes est traite en partant soit du haut soit du bas 
et en progressant ligne par ligne en zigzag. Aussi, les 
groupes adjacents de paires de colonnes ne doivent pas 

30 necessairement progresser dans la meme direction. Ainsi, 
sur la figure 4, la sequence de multiplication pourrait 
aller ainsi : A1B0, A0B0, A0B1 ; A0B3, A0B2, A1B2, A1B1, 
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A3R0 


n u \j f 


A4R0 A4B1 


A3B1 , 


A3B2 , 


A2B2 , 




A1B3 


A1B4 , 


A0B4 , 


A0B5 ; A0B7 , 


A0B6, 


A1B6 , 


A1B5 , 


7\ O T> C 
AZ DO, 




7\ *3 D /I 
A Jtifl / 


Aobo , 


A4B3, A4B2, 


A5B2, 


A5B1, 


A6B1, 


A6B0, 


A7B0 


; A7B1, 


A7B2, 


A6B2, A6B3, 


A5B3, 


A5B4, 


A4B4, 


A4B5, 


A3B5 , 


A3B6, 


A2B6, 


A2B7, A1B7 ; 


A3B7, 


A4B7, 


A4B6, 


A5B6, 


A5B5, 


A6B5, 


A6B4, 


A7B4, A7B3, 


A7B5, 


A7B6, 


A6B6, 


A6B7, 


A5B7 


; A7B7 


Des 


points-virgules i 


separent les 



differents groupes de paires de colonnes dans la liste de 
sequence. Dans cet exemple particulier , des groupes 

10 successifs progressent dans des directions opposees (de 
haut en bas, puis de bas en haut, puis de haut en bas a 
nouveau, etc.) Notez que seul un operande a besoin d'etre 
lu avant que l 1 ensemble puisse executer la multiplication 
suivante, car un operande est deja en place depuis la 

15 multiplication suivante. 

Si des groupes successifs de paires de colonnes 
progressent toujours dans la meme direction, alors un 
certain nombre de registres de memoire cache peut etre 
fourni pour enregistrer certains segments d 1 operande 

20 frequemment utilises necessaires pour eviter deux 
lectures avant la premiere plusieurs multiplie au debut 
de chaque groupe. Dans ce cas, cinq memoires cache 
enregistreront AO, Al, BO , Bl et B2 pendant la moitie 
ascendante de la sequence de multiplication. La moitie 

25 droite de la figure 4, lorsque chaque groupe successif 
deviendra plus long. 

Les figures 5a, 5b et 5c illustrent l'interet 
d 1 avoir de telles memoires cache, en montrant une 
sequence de multiplication pour ce mode de realisation de 

30 1' invention. La premiere colonne represente les acces de 
lecture de la RAM, la deuxieme colonne represente des 
operations de 1' ensemble multiplicateur , et les cinq 
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colonnes les plus a droite montrent le contenu des cinq 
memoires cache pendant chaque cycle de multiplication. 
Pour une multiplication de 8 mots par 8 mots avec 5 
memoires cache, il y a 64 cycles de mult iplication, 7 
5 cycles de chargement de memoire cache uniquement, 5 
cycles de lecture d'autres memoires, plus 3 cycles a la 
fin pour terminer pour un total de seulement 79 cycles. 
L'avantage par rapport aux sequences precedentes est 
encore plus evident quand on multiplie des nombres 

10 entiers plus grands courants dans les applications 
cryptographiques (par exemple, 1024 mots par 1024 bits) . 

La taille en mots de chaque operande peut etre paire 
ou impaire, et ne doit pas necessairement etre la meme 
pour les deux operandes. Le cas presente est souvent 

15 qualifie d'operation de "multiplication rectangulaire". 
Un exemple d'operation de multiplication et 
d 1 accumulation rectangulaire ou un des operandes X a un 
nombre impair de mots (5) et 1' autre operande de 
multiplication Y a un nombre pair de mots (14), et ou 

20 I 1 operande d 1 accumulation Z et le resultat R ont un 
nombre impair de mots (19) est presente dans les figures 
6, 7a r 7b et 7c a titre d 1 illustration . Dans cet exemple f 
il y a aussi 7 registres de memoire cache internes pour 
enregistrer les segments de parametre frequemment 

25 utilises. Seule une partie de la sequence totale est 
montree, pour les groupes R0-R1, R2-R3, R4-R5, R6-R7, ... 
(R9 a Rll omis), R12-R13, R14-R15, et R16-R17. Dans les 
groupes, le modele de multiplication encore une fois est 
arrange de sorte que au plus un acces de lecture de la 

30 RAM et un acces d'ecriture dans la RAM sont requis. La 
premiere colonne indique 1 'adresse RAM specif ique qui est 
appliquee et accedee dans des cycles successifs. Les 
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ecritures dans la RAM sont representees avec des bordures 
en gras. La deuxieme et la troisieme colonnes montrent 
les operations executees par l f ensemble multiplicateur et 
raccumulateur, respectivement . Les sept colonnes les 
plus a droite montrent le contenu des registres de 
memoire cache internes utilises par l'ensemble 
multiplicateur et 1 • accumulateur . 

Cet exemple montre egalement que la sequence de 
multiplication ne doit pas necessairement descendre 
strictement en zigzag de haut en bas ou remonter en 
zigzag de bas en haut sur tout un groupe de paires de 
colonnes. Au contraire, les debuts et/ou les fins de 
telles sequences en zigzag peuvent etre deplaces et meme 
evoluer dans une direction opposee par rapport a la 
premiere partie d'une sequence de groupe, parce que les 
parametres necessaires sont disponibles dans les memoires 
cache. Ainsi, dans le premier groupe R0-R1, 1 1 ordre peut 
etre YOXO, Y0X1, Y1X0, au lieu de YOXO, Y1X0, Y0X1 pour 
une sequence strictement descendante, ou au lieu de Y0X1, 
YOXO, Y1X0 pour une sequence strictement ascendante. Dans 
les deuxieme, troisieme et quatrieme groupes, la sequence 
commence au milieu a Y1X1, Y3X1 et Y5X1 respectivement, 
descend en zigzag jusqu'en bas, puis remonte directement 
jusqu'a Y2X1, Y4X1 et Y6X1 respectivement et se termine 
en zigzag ascendant jusqu'en haut. Cela est possible 
parce que le segment d'operande XI est enregistre dans la 
memoire cache interne, de sorte qu'une seule autre 
lecture suffit malgre le saut de Y0X3 a Y2X1, de Y0X4 a 
Y4X1, et de Y2X4 a Y6X1 respectivement au milieu de la 
sequence. Cela est aussi valable pour 1 1 un quelconque des 
groupes omis dans les figures 7a-7c et pour le groupe 
R12-R13. Dans le groupe R14-R15, la sequence commence en 
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haut et descend strictement en zigzag jusqu'a Y12X3, puis 
saute a Y10X4 et se termine en zigzag ascendant avec 
Y11X4 et Y11X3. Ce saut et changement de direction dans 
la sequence est permis parce que le parametre X4 est deja 
5 disponible dans un registre de la memoire cache, Le 
groupe de multiplication final R16-R17 est represents 
dans un modele en zigzag strictement descendant, mais 
peut se derouler dans n'importe quel ordre parce que les 
segments d'operande X3 et X4 sont disponibles dans des 

10 registres de la memoire cache. 

Les operations d'elevation au carre et les 
operations d' elevations au car re-accumulat ion se 
deroulent de la meme maniere que 1 1 un quelconque des 
exemples precedents, sauf que les operandes X et Y sont 

15 identiques. Cependant, comme les segments specif iques de 
X et Y ne sont generaleraent pas les memes dans un cycle 
de multiplication particulier quelconque, les operations 
d'elevation au carre peuvent etre traitees tout comme 
n'importe quelle autre operation de multiplication dans 

20 laquelle les operandes X et Y different. 
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REVEN D I CAT I ON S 

1. Procede de f onct ionnement d'un circuit de 
multiplication pour calculer le produit de deux operandes 
(X et Y) dont au moins un d'eaux est sensiblement plus 
large que le circuit de multiplication, le circuit de 
multiplication ayant une paire d'entrees d'operandes 
d'une largeur de deux mots et une sortie resultat d'une 
largeur de deux mots, ou un mot est un nombre specif ie de 
bits, chacun des operandes compose d'une pluralite de 
segments d'operande contigus d'une largeur de mot 
ordonnee (x k et y m ) , caracterises par des poids 
specifiques (k et m) , le circuit de multiplication ayant 
acces a une memoire, le procede comprenant les etapes 
consistant a : 

charger des segments d'operandes d'une largeur d'un mot 
des deux operandes dans un ordre specifie a partir de la 
memoire dans le circuit de multiplication, le circuit de 
multiplication comprenant au moins deux registres (RX et 
RY) ayant acces a ladite memoire pour contenir 
temporairement les segments charges ; 

multiplier les segments charges pour obtenir des produits 
intermediates d'une largeur de deux mots, les produits 
intermediaires ayant un poids egal a la somme des poids 
des segments charges ; 

ajouter des produits intermediaires du meme poids dans un 
accumulateur (33), 1 ' accumulateur ayant une taille de 
trois mots plus un nombre de bits de report, suffisante 
pour gerer une taille d'operande maximale specif iee, 
1 ' accumulateur connecte a un registre d f entree de deux 
mots (RZ) pour contenir temporairement tout produit d'un 
poids specifique ajoute precedemment et un registre de 
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sortie a deux mots (RR) pour contenir les resultats d ' une 
etape d ' addition, lesdits registres (RZ et RR) ayant 
acces a ladite memoire ; et 

enregistrer les resultats accumules depuis ledit registre 
35 de sortie (RR) de nouveau dans ladite memoire au moins 
apres accumulation de tous les produits intermediaires du 
poids specifie ; 

dans lequel l T ordre specifie pour les segments d'operande 
de chargement dans lesdits registres est une sequence 

40 definie par les poids des produits intermediaires 
resultants, dans lequel 1 'etape de multiplication est 
faite par groupes successifs de deux poids de produits 
adjacents, avec la sequence a l f interieur d'un groupe 
selectionnee de sorte que, a 1' exception d'une premiere 

45 operation de multiplication dans un groupe donne, au plus 
un des segments d'operande doive etre lu de la memoire et 
place dans un registre (RX ou RY) , 1' autre segment 
d'operande etant deja enregistre dans 1 ? autre registre 
(RY ou RX) a partir de l f operation de multiplication 

50 immediatement precedente. 

2. Procede de la revendication 1, dans lequel le registre 
d'entree de 1 1 accumula teur (RZ) est charge avec un 
segment d'un mot accumule (Z) , ou le segment est du meme 

55 poids que les produits intermediaires a former dans 
ladite etape de multiplication, moyennant quoi le procede 
de f onct i onnemen t execute une operation de 
multiplication-accumulation sur une paire d'operandes de 
multiplication et un operande d 1 accumulation . 

60 

3. Procede de la revendication 1, dans lequel la sequence 
se deroule a l 1 interieur d'un groupe dans un modele en 
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zigzag de poids de segments d'operande augmentant 
constamment . 

65 

4. Procede de la revendication 1, dans lequel la sequence 
se deroule a l'interieur d f un groupe dans un modele en 
zigzag de poids de segments d'operande diminuant 
constamment. 

70 

5. Procede de la revendication 1, dans lequel le circuit 
de multiplication contient en outre un ensemble de 
registre de memoire cache interne, lesdits registres de 
memoire cache (17) etant charges depuis la memoire avec 

75 des segments d'operande qui sont frequemment utilises 
dans une operation de multiplication. 

6. Procede de la revendication 1, dans lequel la sequence 
se deroule a l'interieur d'un groupe commengant par une 

80 operation de multiplication avec au moins un segment 
d'operande enregistre dans un registre de memoire cache 
(17) dans une premiere direction en zigzag de poids de 
segments d'operande augmentant ou diminuant constamment , 
puis passe directement a une operation de multiplication 

85 du groupe pas encore executee qui a aussi au moins un 
segment d'operande enregistre dans un registre de memoire 
cache et continue dans une deuxieme direction en zigzag 
de poids de segments d'operande diminuant ou augmentant 
constamment jusqu'a ce que toutes les operations de 

90 multiplication pour ce groupe soient terminees. 

7. Procede de la revendication 1, dans lequel 1 1 ordre 
specifie est preprogramme dans le logiciel interne dans 
un sequenceur d' operations du circuit de multiplication , 
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95 avec des longueurs de mot d 1 operands incluses en tant que 
parametre d T entree pour une commande de multiplication. 

8. Circuit de multiplication, comprenant : 

un module de multiplication-accumulation (MAC) (21) 
100 comprenant un ensemble mult iplicateur qui introduit des 
segments d'operandes recepteur a mot unique a multiplier 
pour former un produit intermediaire de deux mots, et 
comprenant aussi un circuit accumulateur avec une 
premiere entree de deux mots pour recevoir des produits 
105 intermediaires provenant du mult iplicateur , une deuxieme 
entree de deux mots pour recevoir une valeur accumulee, 
et une sortie de trois mots plus un certain nombre de 
bits de report suffisant pour gerer une taille d'operande 
maximum specifiee pour proposer une somme de valeurs 
110 d f entree provenant des entrees de deux mots, la sortie de 
1 1 accumulateur retournant aussi deux mots a la deuxieme 
entree de deux mots ; 

un ensemble de registres d'adresses internes pour 
adresser une memoire a acces direct ; 

115 un ensemble de registres de donnees internes (RX, RY, RZ, 
RR) connectes pour recevoir et transmettre des segments 
desdites operandes depuis et a destination de ladite 
memoire et aussi connectes audit ensemble multiplicateur 
et audit accumulateur de maniere a fournir des segments 

120 d'operande aux entrees de ceux-ci et a en recevoir des 
resultats, chacun desdits segments d'operande ayant un 
poids specifie ; et 

un sequenceur d T operations pour controler l'acces a la 
memoire par lesdits adresse interne et registres de 
125 donnees et controler la sequence d'operations de 
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multiplication et d 1 accumulation par lesdits ensemble 
multiplicateur et accumulateur respectifs, 

dans lequel ladite sequence est definie par les poids des 
produits resultants egaux a la somme des poids des 

130 segments d'operande en cours de multiplication, dans 
lequel les operations de multiplication sont faites dans 
des groupes successifs de deux poids de produits 
adjacents, avec la sequence dans un groupe selectionne de 
sorte que, excepte une premiere operation de 

135 multiplication dans un groupe donne, au maximum un des 
segments d'operande doive etre lu de la raemoire dans un 
registre (RX ou RY) , l f autre segment d'operande etant 
deja enregistre dans 1' autre registre (RY ou RX) depuis 
1' operation de multiplication immediatement precedente . 
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